构建能自我优化的AI Agent:Reflection和Reflexion机制对比与实现
反思策略本质上就是让LLM对自己的行为进行自我批评。有时反思器还会调用外部工具或检索系统来提升批评的准确性。这样一来系统输出的就不再是一次性的回答,而是经过多轮生成-审阅循环优化后的结果。
反思策略本质上就是让LLM对自己的行为进行自我批评。有时反思器还会调用外部工具或检索系统来提升批评的准确性。这样一来系统输出的就不再是一次性的回答,而是经过多轮生成-审阅循环优化后的结果。
每次小R犯错之后,你跟它说"你这样做不对,应该那样做",它点头如捣蒜:"好的好的,我记住了!"结果下次遇到同样问题,它还是犯一模一样的错误,就像得了健忘症一样。